返回

横向对比几家大模型厂商的深度研究(deep research)类工具产品

作者 兴之所志 发布于 2025.05.01 AI工具

深度研究

这里说的深度研究(deep research)类工具产品,属于AI Agent的范畴,它是指以基座大模型的能力为基础,基于用户提出的研究课题或主题,自动规划研究方法和步骤,然后通过对网上相关信息和内容进行深度检索和分析,最终生成详细研究报告。

这类工具产品能够很好地帮助我们快速了解某一个领域或主题的相关信息和知识,可能是目前我觉得AI应用最有潜力的一个合法领域,随着产品的不断成熟,有可能成为AI的第一个“打手级”(杀手级好像还到不了)应用。

最早推出的深度研究(deep research)类工具产品的是Google在2024年年底推出的Gemini Deep Research,随后OpenAI于2025年2月面向其Pro用户推出OpenAI deep research,之后国外多个大模型厂商如xAI(Grok)、Anthropic(Claude)、Perplexity也逐步推出类似功能。

值得一提的是,OpenAI在2025年4月25日宣布其免费ChatGPT用户每个月可以使用5次deep research轻量级版本,终于让普通用户也可以体验到“地表最强”大模型的深度研究能力了。 Pasted image 20250501101657

本文试用的深度研究类工具产品包括:OpenAI deep research轻量版(下称ChatGPT)、Gemini Deep Research(下称Gemini)、Grok DeeperSearch(下称Grok)、Perplexity Research(下称Perplexity)、秘塔AI搜索-研究(下称秘塔)、智谱清言AutoGLM沉思(下称智谱)。本文试用的深度研究类工具产品均为免费用户版本,由于Claude的深度研究类产品仅供付费用户使用,所以未在本次试用范围之类。

研究主题

最近看了一篇Google DeepMind CEO Demis Hassabis的访谈报道,他预测具备人类水平认知能力的AGI将在5-10年到来,这让我对AI领域权威人士预测AGI的话题产生了极大的兴趣,本来想着网上搜索一番,看看还有哪些“大嘴”做过类似的预测,突然想起各家的深度研究功能,于是正好借这一问题对比看看各家的报告产出质量如何。

以下为对各深度研究产品的输入信息(研究要求),由于试用的先后顺序,输入信息在细节上可能会有一点差异,但不影响最终结果的呈现。

“全面梳理一下截止到目前为止一年内,AI领域的权威人士对于AGI什么时候到来的预测,需要明确清楚相关人员的个人教育和职业背景、做出预测的时间、预测AGI到来的时间以及做出预测的相关判断依据或其他背景信息,最后表达你对这一问题的看法和意见。”

总体感受

第一梯队:ChatGPT轻量版胜在精准,毫无冗余信息,Gemini胜在全,但关键信息有所不足。 第二梯队:Perplexity和Grok收集信息量不足,但在分析深度上Perplexity略高于Grok;秘塔有点魔怔,时间都是错的,本来应该排在最后,但是仔细看完智谱的内容后发现智谱是最差的,秘塔的专家人数还可以,呈现内容中规中矩,不考虑时间错误的话,和Perplexity和Grok可以打个有来有回。 第三梯队:智谱的定位应该也是接近深度研究的,所以生成的结果很具有欺骗性,看起来篇幅很多内容很丰富,但其实质量很有问题,需要他说的不好好说,没让他说的发挥一大堆。

ChatGPT轻量版 > Gemini >>>Perplexity>Grok> 秘塔> 智谱

基于以上评估,后续使用深度研究功能时,优先使用ChatGPT、Gemini和秘塔生成相关内容,Perplexity、Grok还有智谱清言保持关注。

研究结果

ChatGPT

截图

Pasted image 20250501110404

ChatGPT

预测人员列表

姓名教育背景职业背景预测时间预测AGI到来时间
Sam Altman斯坦福大学肄业(计算机)OpenAI CEO,前YC总裁2024年12月2025–2029(特朗普任期内)
Demis Hassabis剑桥大学CS本科,UCL神经科学博士DeepMind CEO2025年4月2030–2035(5–10年内)
Elon Musk宾大经济+物理学士特斯拉/SpaceX CEO,xAI创始人2024年4月2025–2026
Dario Amodei普林斯顿数学博士Anthropic CEO,前OpenAI研究主管2024年11月2026–2027
Jensen Huang(黄仁勋)交大电子学士,斯坦福硕士NVIDIA CEO2024年3月2029前
Mustafa Suleyman牛津大学PPE学士微软AI负责人,前DeepMind联合创始人2024年12月2030–2032(5–7年)
李开复哥伦比亚大学CS学士,卡耐基梅隆博士创新工场&零一万物创始人2024年11月2031左右(7年)
张鹏蒙特利尔大学CS学士,MIT硕士智谱AI CEO2024年4月未明示(认为2024是冲刺元年)
倪贤豪兰州大学CS本科,清华访学智源研究院战略负责人2024年12月2027前(3年内)

评价

  • 优点1:对于用户要求中不太明确的地方,能够通过与用户的交互进行明确,就像一个有独立思考能力的下属,对于上级布置的任务懂得通过提问来使任务更清晰。
  • 优点2:输出内容整体质量最高,对于权威人士的预测,从教育背景、职业背景、预测时间、预测结果和预测依据几个角度给出了清晰的信息,尤其是在预测时间上还具体说明了是在接受哪个媒体哪个节目的采访时说的,有鼻子有眼,可信度大幅增加。
  • 缺点:可能是轻量版的缘故,专家数量和内容篇幅上相对少了一点,少了2024年诺贝尔物理学奖获得者、“AI教父”杰弗里·辛顿(Geoffrey Hinton)不太应该,完全版的内容可能会更扎实一点吧。

Gemini

截图

Pasted image 20250501111237

Gemini

预测人员列表

专家姓名机构/职位预测日期(来自Snippet)预测AGI到来时间
萨姆·奥特曼(Sam Altman)OpenAI首席执行官2024年12月/2025年1月2025年/5-8年
伊隆·马斯克(Elon Musk)特斯拉/X负责人,OpenAI联合创始人2025年3月2025年/2026年
达里奥·阿莫代伊(Dario Amodei)Anthropic首席执行官2025年1月/2025年3月2026年/2027年
沙恩·莱格(Shane Legg)Google DeepMind联合创始人兼首席AGI科学家2025年3月2028年
德米斯·哈萨比斯(Demis Hassabis)Google DeepMind首席执行官2025年1月/2025年3月至少10年/5-10年
扬·勒昆(Yann LeCun)Meta首席AI科学家2025年1月/2025年3月5-6年/3-5年/10年内
杰弗里·辛顿(Geoffrey Hinton)多伦多大学名誉杰出教授2025年3月/2025年3月10年内(可能导致人类灭绝)/5-20年
雷·库兹韦尔(Ray Kurzweil)谷歌首席未来学家2025年2月/2025年3月2029年
孙正义(Masayoshi Son)软银首席执行官2025年2月/2025年2月2026-2027年/10年内(ASI)
尼古拉·尤尔科维奇(Nikola Jurkovic)哈佛大学2025年2月/2025年4月2027年
约翰·舒尔曼(John Schulman)Anthropic研究员,OpenAI联合创始人2025年2月2027年(AGI)/2029年(ASI)
伊利亚·苏茨克维尔(Ilya Sutskever)OpenAI联合创始人兼首席科学家2025年3月/2024年12月未明确给出,但强调预训练终结
李飞飞斯坦福大学教授2025年3月/2024年7月未明确给出
格雷格·布罗克曼(Greg Brockman)OpenAI总裁2025年2月/2025年3月2025年(AI代理)/2024年(突破)
佩德罗·多明戈斯(Pedro Domingos)华盛顿大学名誉教授2024年3月3-8年

评价

  • 优点1:篇幅最多,报告中既有文字说明又有表格汇总,既有前情介绍也有后续分析。
  • 优点2:涉及到的英文领域人员最全,AI大厂如OpenAI、xAI、Anthropic、Google DeepMind、Meta等的大佬都涵盖了,2024年诺贝尔物理学奖获得者、“AI教父”杰弗里·辛顿也在列。不过就是少了前DeepMind联合创始人、现微软AI负责人Mustafa Suleyma有点奇怪。
  • 缺点1:虽然有先提供研究方案让用户进行确定,但比起ChatGPT通过提问的方式明确研究要点还是要略逊一点点,比如研究方案没有提到专家来源,最后默认是英文领域专家。
  • 缺点2:从专家简介、预测时间、预测依据及相关信息、相关Snippet ID、分析等几个维度对每个专家的介绍,但无视教育背景的信息要求。
  • 缺点3:信息明显没有ChatGPT更精准更切题,反而是篇幅都花在其他周边信息上,可能跟Gemini deep research的大而全的定位有关?

Grok

截图

Pasted image 20250501110653

Grok

预测人员列表

专家姓名教育与职业背景预测时间AGI到来的时间
Sam AltmanOpenAI CEO,前Y Combinator总裁,计算机科学与创业背景2024年晚期2025年
Ajeya CotraOpen Philanthropy高级研究员,UC Berkeley电气工程与计算机科学学士2025年中位数2038年,25%概率2028-2029年
Dario AmodeiAnthropic CEO,前OpenAI研究员,Princeton物理学博士2024年2026年
Shane LeggGoogle DeepMind联合创始人兼首席AGI科学家,AI博士2024年重申50%概率2028年
Geoffrey HintonUniversity of Toronto教授,前Google研究员,神经网络领域先驱2024年2029-2044年
Demis HassabisDeepMind联合创始人兼CEO,认知神经科学博士2025年2030-2035年

评价

  • 优点:没有明显优点。
  • 缺点1:整体来说偏简洁了一点,专家数量也不够多,居然能少了自己的老板也是有点个性。但简洁可能是定位的原因,再deeper的search也还是定位为search,并没有想往research报告上面硬凑。
  • 缺点2:从背景、预测时间与内容、判断依据和背景信息几个角度进行分析,但是背景信息这个维度不知所云。

Perplexity

截图

Pasted image 20250501110851

Perplexity

预测人员列表

权威人士教育背景职业背景预测时间预测AGI实现时间
Sam Altman斯坦福大学计算机科学辍学Loopt创始人,Y Combinator总裁,OpenAI CEO2024年12月2025年首批AGI应用案例
Dario Amodei斯坦福大学理论物理博士Google Brain研究员,OpenAI安全负责人,Anthropic CEO2025年4月2026-2027年
Mustafa Suleyman牛津大学哲学与神学学士DeepMind联合创始人,Inflection AI CEO,微软AI负责人2025年4月2030-2032年
Geoffrey Hinton剑桥大学心理学学士,爱丁堡大学AI博士卡内基梅隆大学教授,多伦多大学教授,Google Brain顾问2025年2月5-20年内
Yoshua Bengio麦吉尔大学计算机科学博士MIT博士后,蒙特利尔大学教授,Mila研究院创始人2025年2月1-10年内

评价

  • 优点:教育背景信息单列。
  • 缺点:Perplexity研究和深度研究可能还是有区别,整体来说偏简洁了一点,专家数量也不够多,少了xAI和DeepMind的大佬不太应该。

智谱

截图

Pasted image 20250501111035

智谱

预测人员列表

没有生成表格,略过。

评价

  • 缺点1:内容庞杂,感觉是想对标Gemini,但是梳理出的专家不足,少了Anthropic和微软AI负责人。
  • 缺点2:输出内容很多,但在关于AGI的其他话题上面发挥过度,如AGI实现路径分析、AGI实现时间预测趋势、AGI实现的社会影响和调整等,这些并不是我的诉求,明显是模型为了撑内容在过度发挥。
  • 缺点3:关键核心信息不足,呈现内容提炼总结不够,大量引用文字,如下图所示,毫无结构化呈现效果。 Pasted image 20250501184219

秘塔

截图

Pasted image 20250501110941

秘塔

预测人员列表

姓名职位/背景预测时间预测内容
Sam AltmanOpenAI CEO;斯坦福大学计算机科学辍学;主导ChatGPT和GPT-4开发2024年初、2024年12月5年内实现AGI;未来12个月或有重大突破
李彦宏百度CEO;北京大学信息管理学士;布法罗纽约州立大学计算机硕士;中国AI商业化领军者2024年5月AGI需要至少10年
Demis HassabisDeepMind CEO;剑桥大学计算机科学双学位;AlphaGo和AlphaFold核心开发者2025年1月5-10年实现AGI,需2-3项关键突破
李开复创新工场CEO;卡内基梅隆大学计算机博士;零一万物创始人2024年12月2030年实现AGI
吴恩达斯坦福教授;MIT博士;“Google大脑”创始人2023年、2024年8月严格AGI需30-50年;若放宽标准或缩短至1-2年
Geoffrey Hinton多伦多大学教授;剑桥大学实验心理学博士;深度学习三巨头之一2023年5-20年内实现AGI
李飞飞斯坦福大学教授;ImageNet创始人;普林斯顿大学物理学士未直接预测时间三维空间智能是AGI必要条件
Yoshua Bengio蒙特利尔大学教授;图灵奖得主;注意力机制提出者2023年、2024年几十年内实现;调整为“几年到几十年”
马斯克特斯拉CEO;Neuralink和xAI创始人;宾夕法尼亚大学物理和经济学双学位2024年2026年出现AGI
黄仁勋英伟达CEO;斯坦福大学电子工程硕士;GPU架构革命领导者2024年5年内AI通过所有人类测试

评价

  • 优点:中英文人士都有,国内内容相对会多一点。
  • 缺点1:时间不知道为啥很混乱,试了两次都是这样。
  • 缺点2:专家少了Anthropic和微软AI负责人,但不算大问题。

兴之所志

2025-05-01